2013/05/29

[Data Analytics] 結構主義與資料分析

標題跟附圖好像都有點哲學味道,但是其實想要談的是資料分析。

附圖是孫隆基老師的「中國文化的深層結構」,是快20年前好友送我的生日禮物。時光芢苒,人事沉浮,那麼多年過去了,書的具體內容其實早已遺忘,最近因著工作的關係,又拿出來重讀。

作者在書名上就明確的表達了寫這本書的目的:尋找華人文化裡屬於「深層」的,比較不變的一些共同特徵。

孫老師是歷史學家,這本書的內容,採取的是結構主義的方法。簡單的說,就是從同一個系統的眾多現象當中,找出不斷反覆出現的特徵,作為「深層結構」。

暫且不論書中所描述的發現,「在現象中尋找反覆出現的特徵」這件事,其實也是資料分析裡常見的課題。

探索式的資料分析(exploratory data analysis)一般是用來為觀察資料做摘要的分析工具,包含了很多不同的統計分析方法與視覺化技巧,讓我們可以看到資料表面以外的內容。

主成分分析」(Principal Component Analysis, PCA)是探索式資料分析裡常用的方法之一,可以幫我們找出所觀察到的現象裡的「異」最常發生的向度,而這些稱之為「主成分」的少數幾個向度,也就形成了所觀察到現象裡的所謂的「結構」。

探索式資料分析涵蓋的方法很多,於此無法一一解釋,但是「使用這套分析方法」的本身,其實已經揭示了一種結構主意與存在主義的哲學意涵:觀察記錄的「存在」可以反映出某種真實的「本質」,而透過對反覆出現現象的詮釋,可以推導出現象背後的結構。

不知道有沒有人把李維史陀的研究手稿拿來做量化分析的,很好奇這些資料會不會讓我們看到那些原住民部落的另一種文化結構?

沒有留言: